Blindaje composicional basado en contratos para aprendizaje por refuerzo multiagente seguro
Aprende cómo el blindaje por contratos permite seguridad determinista en aprendizaje multiagente descentralizado, optimizando la recompensa sin control centralizado.